Teste Prático - EstatMG

Autor

Arthur Damasceno

Data de Publicação

1 de outubro de 2025

Resumo

Com base na análise de acidentes rodoviários de 2020, os principais pontos de risco foram identificados, revelando padrões geográficos, temporais e de condições específicas. ​A análise mostra que, embora Betim tenha o maior volume de acidentes, Patos de Minas apresenta a maior taxa de mortalidade. As rodovias BR-381 e BR-040 são as mais perigosas, com quilômetros específicos na BR-040 apontados como de alta criticidade. O tipo de acidente mais comum é a “saída de leito carroçável”. ​Fatores como o clima e o tipo de pista também são determinantes: a neblina e as pistas simples estão associadas a uma maior severidade dos acidentes. ​Temporalmente, os finais de semana concentram a maior frequência de ocorrências. O horário mais letal é a madrugada, apesar de a maioria dos acidentes ocorrer nos horários de pico. Observou-se também uma queda atípica em abril, possivelmente pela pandemia de COVID-19, e um pico em dezembro, relacionado às viagens de fim de ano.

1.1 Análise Preliminar dos Dados

Os dados já estão bem organizados e é possível inferir facilmente o significado das colunas. Um possível ponto de confusão é o formato da data (data_inversa), que segue o padrão internacional (ano/mês/dia).

Tabela 1.1: Resumo detalhado das variáveis do dataset de acidentes.

Informação Variável
Onde e Quando id | data | dia | horário | uf | br (6% NA) | km (6% NA) | município
Como Aconteceu tipo_acidente | fase_dia | condicao_metereologica | tipo_pista
Impacto do Acidente pessoas | mortos | feridos | ilesos | veiculos
Localização Precisa latitude | longitude

1.1.1 Estatísticas Descritivas

A análise das estatísticas descritivas das variáveis numéricas não revelou, à primeira vista, dados suspeitos ou a existência de outliers evidentes, considerando valores como o número máximo e mínimo de feridos, o desvio padrão e a variância. Alguns achados interessantes envolvem os veículos, uma vez que a mediana é 1,0, enquanto a média é 1,55. Isso significa que mais de 50% dos acidentes registrados envolvem apenas um único veículo.

O número máximo de pessoas envolvidas é de 14; no entanto, a média é de 2,23 pessoas. Considerando as mortes e os feridos graves, a mediana, o primeiro e o terceiro quartil são zero. Portanto, pelo menos 75% de todos os acidentes neste dataset não tiveram vítimas fatais.

Além disso, existem pouquíssimos valores ausentes (NA), concentrados nas colunas br e km, que se referem, respectivamente, à rodovia e ao quilômetro onde o acidente ocorreu. Essas ausências correspondem a cerca de 6,12% do total de observações. Tais observações não aparentam ter um padrão em comum, seja em localização, número de vítimas ou tipo de acidente, o que sugere que podem ser falhas no momento do registro dos dados ou acidentes em locais não formalmente catalogados.

A matriz de correlação (Método de Spearman) indicou, em sua maioria, relações con- sideradas óbvias entre as variáveis. Como no correlogramas abaixo

As correlações mais fortes estão relacionadas ao número de pessoas envolvidas e suas consequências imediatas. Logicamente, se há mais pessoas, haverá mais veículos, feridos e ilesos. O restante das correlações observadas parece ser bem razoável.

As medidas de associação, por outro lado, trazem resultados mais curiosos. O município onde aconteceu o acidente parece ter relação com a maioria das variáveis, o que pode significar que municípios com estruturas viárias piores ou mais antigas influenciam o tipo de ocorrência. Além disso, o tipo de pista parece estar bem associado ao tipo de acidente.

1.2 Planejamento da Análise

Diante desse cenário e para realizar tanto as análises solicitadas quanto outras explorações pertinentes, elaboramos os seguintes eixos para guiar o trabalho.

Objetivo do Cliente

“Meu objetivo é avaliar as principais causas de acidentes nas rodovias de Minas Gerais, bem como um mapeamento dos tipos de acidentes e das rodovias. Também gostaria de entender os acidentes de acordo com variáveis relativas a tempo: dia da semana e mês.”

Eixos de Análise Propostos

  1. Análise das Causas de Acidentes:
      1. Distribuição por condição meteorológica.
      1. Distribuição por tipo de pista.
  2. Análise de Variáveis Temporais:
      1. Evolução mensal do número de acidentes.
      1. Distribuição de acidentes por dia da semana.
      1. Distribuição por faixa de horário.
  3. Análise de Variáveis Geográficas:
      1. Distribuição geográfica de mortos e feridos.
      1. Ranking das 10 principais rodovias (BRs) com maior número de ocorrências.
  4. Métricas e Proporções Chave:
      1. Taxa de mortalidade
      1. Taxa de feridos graves
      1. Taxa de ilesos

1.2 Análise das Causas de Acidentes

Distribuição por Condição Meteorológica

Quanto à influência do clima, observa-se que a maioria dos acidentes ocorre sob céu limpo. No entanto, a taxa de mortalidade é substancialmente maior em condições de neblina, o que reforça a necessidade de condução cuidadosa neste contexto.

Distribuição por Tipo de Pista

Embora o tipo de pista não apresente uma correlação intensa com a mortalidade geral, nota-se uma maior concentração de mortes em acidentes ocorridos em pistas simples.

Distribuição por Tipo de Acidente

O tipo de acidente mais frequente é a “saída de leito carroçável”, correspondendo a 25% do total das ocorrências. Este evento ocorre quando um veículo sai da pista e se desloca para uma área adjacente (barranco, ribanceira, etc.).

De acordo com o plot, pistas Duplas e Múltiplas mostram maior propensão a acidentes relacionados ao fluxo (colisão traseira), enquanto a pista Simples evidencia o alto risco de acidentes severos como a colisão frontal.

1.3 Análise Temporal

Acidentes por Mês

Dezembro destaca-se como o mês com o maior número de acidentes, uma tendência que pode ser atribuída ao aumento do tráfego durante as viagens de fim de ano. Em oposição, abril regista o menor volume de ocorrências, um resultado provavelmente relacionado com o fenómeno do isolamento social.

A análise mensal do total de acidentes revela uma queda acentuada em abril, que pode ser inferida como um resultado das restrições impostas pela pandemia de COVID-19. Em contrapartida, observa-se um pico de ocorrências em dezembro, possivelmente associado às viagens de fim de ano.

Quanto à distribuição semanal, sexta-feira, sábado e domingo são os dias com maior volume de acidentes, o que pode ser atribuído ao aumento do fluxo de veículos devido a lazer, viagens e outros compromissos de fim de semana.

Acidentes por Dia da Semana

As manhãs de sábado apresentam a maior proporção de ocorrências (19,5%), despontando como o período mais crítico. Em seguida, as noites de sexta-feira a domingo formam um bloco de alto risco, com proporções que variam de 16,9% a 18,5%. Este padrão sugere que o início e o fim dos períodos de lazer do fim de semana são momentos que demandam maior atenção e possíveis ações preventivas.

Acidentes por Hora do Dia

A análise por horário acompanha a mesma lógica dos dias úteis, com picos de acidentes no início da manhã (aproximadamente às 6h) e no final da tarde, coincidindo com os horários de deslocamento para o trabalho. No entanto, a mortalidade segue um padrão distinto: a madrugada concentra o maior número de mortes, com um aumento progressivo que se inicia no começo da noite.

1.4 Análise Geográfica

Top 10 Municípios com Mais Mortos e Feridos

Na análise das variáveis geográficas, percebe-se que, embora o município de Betim registre o maior número absoluto de acidentes, Patos de Minas apresenta o maior número de mortes.

Top 10 Rodovias (BRs) com Mais Ocorrências

Top 10 Pontos Críticos (BR + KM)

As rodovias BR-381 e BR-040 concentram o maior número de ocorrências, um dado consistente com a reputação de ambas. Uma análise mais detalhada por quilómetro revela que a BR-040 domina o ranking de pontos críticos, especialmente nos KMs 510 e 511. Esta concentração sugere a provável existência de uma falha grave de planeamento ou segurança nesse trecho específico.

1.5 Métricas e Proporções Chave

Taxas de Severidade e Ilesos (2020)

Métrica Valor (%) Total Absoluto
Taxa de Mortalidade 3.58% 521
Taxa de Feridos Graves 12.66% 1.845
Taxa de Ilesos 39.70% 5.785

As taxas gerais do conjunto de dados revelam uma percentagem de acidentes fatais que, embora baixa, é significativa. A análise gráfica indica que, na maioria das ocorrências com vítimas fatais, regista-se apenas uma morte por acidente.

Para a análise da distribuição geográfica dos acidentes, foram gerados dois mapas interativos.

O primeiro mapa representa cada acidente como um círculo, onde o raio é proporcional à gravidade do evento (número de mortos). Esta visualização permite a rápida identificação dos acidentes mais letais e sua localização exata.

O segundo mapa utiliza uma técnica de clusterização (agrupamento), que agrupa acidentes geograficamente próximos em um único ponto. Essa abordagem é ideal para identificar “hotspots”, ou seja, as áreas com maior concentração e frequência de acidentes, limpando a visualização em escalas mais amplas.

##Conclusão

Este trabalho analisou os acidentes rodoviários em Minas Gerais durante o ano de 2020. A análise revelou que as rodovias BR-381 e BR-040 são os principais focos de ocorrências, com pontos específicos na BR-040 apresentando uma concentração de acidentes.

Temporalmente, os finais de semana e os horários de pico (manhã e final de tarde) registram o maior volume de colisões. Contudo, é na madrugada que o risco de morte se torna mais elevado. Fatores como pista simples e condições de neblina também foram associados a uma maior severidade dos acidentes, enquanto a “saída de leito carroçável” se destacou como o tipo de ocorrência mais frequente.

Os resultados apontam para a necessidade de intervenções estratégicas. A fiscalização deve ser intensificada nos trechos mais críticos identificados. Campanhas de segurança devem alertar para os perigos específicos da condução na madrugada e em condições climáticas adversas. A longo prazo, o investimento na melhoria da infraestrutura.

Embora limitado ao ano atípico de 2020, os dados se mostraram muito relevantes e completos, com diversas têndencias ao longo do EDA, como texto prático gostei muito de realizar o trabalho, agradeço a EstatMG pela oportunidade e quem sabe fazer parte do time!

Obrigado pela Atenção.